# Cadenas de caracteres

Las cadenas de caracteres (denominadas habitualmente y de manera indistinta como *strings*) son un tipo de dato 
que contiene una secuencia de s√≠mbolos, mismos que pueden ser alfan√∫mericos o cualquier otro s√≠mbolo propio de 
un sistema de escritura. En Python los strings se definen utilizando comillas dobles o simples. Observa los siguientes ejemplos:

In [48]:
nombre = "Catalina"
type(nombre)

str

In [49]:
apellido = 'Lara'
type(apellido)

str

Observa que es indistinto utilizar las comillas dobles o simples al momento de crear una cadena de caracteres. Si se requiere crear una cadena de caracteres multil√≠nea, entonces se pueden definir utilizando un tres comillas dobles, tal como se muestra en el siguiente ejemplo:

In [50]:
en_paz = """
Muy cerca de mi ocaso, yo te bendigo, vida,
porque nunca me diste ni esperanza fallida,
ni trabajos injustos, ni pena inmerecida;
"""
type(en_paz)

str

La longitud o cantidad de elementos de una cadena se puede determinar utilizando la funci√≥n `len`:

In [51]:
palabra = "Hola"
len(palabra)

4

## Concatenaci√≥n de cadenas

Para concatenar (unir) cadenas se puede utilizar el operador `+`. Observa el siguiente ejemplo en el cual se concatenan las cadenas `"hola"` y `"mundo"`.

In [52]:
"Hola" + "mundo"

'Holamundo'

Notar√°s que Python por s√≠ mismo no sabe que estamos uniendo dos palabras y que entre ellas deber√≠a haber un espacio para su correcta lectura, evidentemente este tipo de cuestiones son las que el programador debe tomar en cuenta al escribir un c√≥digo. Si quisi√©ramos introducir un espacio entre las dos palabras podr√≠amos a√±adirlo de forma manual en alguna de las cadenas, o como una tercera cadena intermedia, tal como se muestra enseguida:

In [53]:
"Hola" + " mundo"

'Hola mundo'

In [54]:
"Hola" + " " + "mundo"

'Hola mundo'

Otra manera de concatenar cadenas es utilizar el m√©todo `join`. Este m√©todo nos sirve para unir una lista de cadenas mediante un separador, por ejemplo:

In [55]:
primer_nombre = "Ana"
segundo_nombre = "Isabel"
separador = " "
separador.join( [primer_nombre, segundo_nombre] )

'Ana Isabel'

In [56]:
separador = "---"
separador.join( [primer_nombre, segundo_nombre] )

'Ana---Isabel'

La cantidad de cadenas a unir pueden ser m√°s dos, observa el siguiente ejemplo:

In [57]:
", ".join(["Ana", "Jorge", "David", "Jos√©", "Juan"])

'Ana, Jorge, David, Jos√©, Juan'

Naturalmente, el separador puede ser cualquier caracter v√°lido, incluyendo algunos poco *usuales*:

In [58]:
" \U0001F970 ".join(["Ana", "Jorge", "David", "Jos√©", "Juan"])

'Ana ü•∞ Jorge ü•∞ David ü•∞ Jos√© ü•∞ Juan'

## Indexaci√≥n y *slicing*

Las cadenas de caracteres son secuencias de elementos, donde cada elemento corresponde a un caracter espec√≠fico. Cada elemento de la cadena tiene asociado un √≠ndice, el cual corresponde a la posici√≥n en que se encuentran, y por lo tanto ser√°n enteros positivos. La numeraci√≥n de los √≠ndices comienza en cero. En la figura se muestra una cadena de caracteres *guardada* en la variable `nombre`, podemos observar que a cada caracter le corresponde un √≠ndice. Por ejemplo, a la letra `C` le corresponde el √≠ndice 0, a la letra `t` el √≠ndice 2.

![](img/cadenas/strings_index.svg)

Se puede acceder a cada una de los s√≠mbolos que componen una cadena mediante la notaci√≥n `cadena[idx]`, donde  `cadena` es el nombre de la cadena e `idx` el √≠ndice en que se encuentra el caracter al cual se desea acceder, siendo 0 para la primera letra, 1 para la segunda y as√≠ de manera consecutiva. Veamos el ejemplo descrito en la figura, primero creamos la cadena `nombre`:

In [59]:
nombre = "Catalina"

Si quisi√©ramos acceder a la letra `C` tendr√≠amos que utilizar el √≠ndice `0`, es decir:

In [60]:
nombre[0]

'C'

Para acceder a la letra `t` utilizar√≠amos el √≠ndice `2`: 

In [61]:
nombre[2]

't'

En las secuencias se pueden utilizar tambi√©n √≠ndices negativos para acceder a los elementos. En este caso, el √∫ltimo elemento siempre tendr√° asociado el √≠ndice `-1` y a partir de ah√≠ hacia la izquierda el √≠ndice de cada elemento adyacente disminuye una unidad, es decir, $-1, -2, -3, -4, ..., -n$, donde $n$ es el n√∫mero de elementos de la secuencia. En la siguiente figura podemos observar los √≠ndices negativos asociados a cada elemento de la cadena almacenada en la variable `nombre`.

![](img/cadenas/strings_negative_index.svg)

As√≠, si quisi√©ramos acceder al √∫ltimo elemento de dicha cadena, podr√≠amos hacerlo utilizando el √≠ndice `-1`:

In [62]:
nombre[-1]

'a'

Es importante tener en cuenta que una cadena de caracteres no s√≥lo est√° compuesta de s√≠mbolos alfanum√©ricos, sino tambi√©n signos de puntuaci√≥n o espacios en blanco o saltos de l√≠nea, etc. Vamos a crear una variable llamada `frase`, en la cual guardamos una cadena compuesta por dos palabras, separadas por un espacio.

In [63]:
frase = "Hola. Adi√≥s."

Si accedemos al elemento en el √≠ndice `4`, podemos observar que este corresponde al punto:

In [64]:
frase[4]

'.'

Ahora, si accedemos al elemento en el √≠ndice `5`, veremos que el elemento correspondiente es el espacio:

In [65]:
frase[5]

' '

Ahora vamos a revisar una manera de acceder a una porci√≥n de una secuencia, no a un s√≥lo elemento como lo hacemos con la indexaci√≥n. Habitualmente se denomina *slicing* a este tipo de operaci√≥n. Con la sintaxis `cadena[a:b]` podemos acceder al conjunto de caracteres comprendidos entre los √≠ndices `a` y `b-1`.

Observa la siguiente l√≠nea, la cual nos permite *tomar* los elementos con √≠ndices 0 y 1:

In [66]:
nombre[0:3] # Elementos 0, 1 y 2

'Cat'

Esta otra l√≠nea nos permite *acceder* a los elementos con √≠ndices 2, 3, 4, 5 y 6:

In [67]:
nombre[3:7] # elementos 3, 4, 5 y 6

'alin'

C√≥mo ya habr√°s notado la cuesti√≥n es simple e intuitiva, s√≥lo debemos tener cuidado con la notaci√≥n y recordar que no se incluye el elemento dado por el √≠ndice superior, sino hasta el correspondiente al √≠ndice inmediatamente anterior a este. En la siguiente figura puedes observar una representaci√≥n gr√°fica de las dos operaciones de *slicing* anteriores.

![](img/cadenas/slicing.svg)

Cuando se prescinde de uno de los √≠ndices en la notaci√≥n de *slicing*, se asume que se toman todos los valores desde el inicio hasta el √≠ndice indicado menos uno; o bien desde el √≠ndice establecido hasta el final de la cadena; esto dependende, obviamente, del √≠ndice del cual se prescinda.

Por ejemplo, la siguiente l√≠nea toma los elementos desde el inicio de la cadena hasta el √≠ndice `4-1`:

In [68]:
nombre[:4]

'Cata'

Esta otra l√≠nea toma los elementos desde el √≠ndice `4` hasta el final de la cadena.

In [69]:
nombre[4:]

'lina'

La siguiente imagen muestra una representaci√≥n gr√°fica de lo descrito anteriormente.

![](img/cadenas/slicing_2.svg)

De una cadena de caracteres tambi√©n pueden obtenerse un conjunto de elementos sin tomarlos de uno en uno, sino cada dos, cada tres, etc. Si utilizamos la notaci√≥n `cadena[a:b:n]`, nos devolver√° el conjunto de elementos comprendidos entre los √≠ndices `a` y `b-1`, tomados cada `n` elementos. Observa el siguiente ejemplo:

In [1]:
nombre = "Agust√≠n"
nombre[0:4:2]

'Au'

La l√≠nea anterior nos devuelve los elementos ubicados en los √≠ndices $0, 1, 2 \, y \, 3$, pero de estos √∫nicamente los *toma* a cada dos elementos, es decir:

* Comenzamos tomando el elemento de √≠ndice $0$ (letra `A`), 
* *Ignoramos* el elemento de √≠ndice $1$ (letra `g`) 
* *Tomamos* el elemento de √≠ndice $2$ (letra `u`)
* *Ignoramos* el elemento de √≠ndice $3$ (letra `s`)

En este punto se han agotado todos los elementos comprendidos entre los l√≠mites indicados, podemos observar que los √∫nicos elementos *tomados* y devueltos por la instrucci√≥n `nombre[0:4:2]` son la letra `A` y `u`, tal como se mostraba en la l√≠nea anterior. En la siguiente figura se muestra un esquema gr√°fico de esta operaci√≥n.

![](img/cadenas/slicing_3.svg)

Veamos ahora otro ejemplo con la misma cadena:

In [2]:
nombre[3:7:3]

'sn'

Observa que en este caso tomamos los elementos ubicados en los √≠ndices $3, 4, 5 \, y \, 6$, pero tomados cada tres elementos, es decir:

* *Tomamos* el elemento ubicado en el √≠ndice `3` (letra `s`)
* *Ignoramos* el elemento ubicado en el √≠ndice `4` (letra `t`)
* *Ignoramos* el elemento ubicado en el √≠ndice `5` (letra `√≠`)
* *Tomamos* el elemento ubicado en el √≠ndice `6` (letra `n`)

Una representaci√≥n gr√°fica de esta operaci√≥n la puedes observar en la siguiente figura.

![](img/cadenas/slicing_4.svg)

Si quisi√©ramos tomar todos los elementos de una cadena a cada dos, podr√≠amos hacer lo siguiente:

In [3]:
nombre[::2]

'Autn'

Una manera muy sencilla de invertir el orden de los elementos en una cadena de texto es utilizando esta notaci√≥n de *slicing*, pero utilizando un valor negativo. Observa lo siguiente:

In [4]:
nombre[::-1]

'n√≠tsugA'

Puedes notar r√°pidamente que se toman todos los elementos de la cadena, pero comenzando desde el final con un *paso* negativo. Lo mismo se podr√≠a hacer pero tomando a cada dos elementos, de la siguiente manera:

In [5]:
nombre[::-2]

'ntuA'

## May√∫sculas y min√∫sculas

Cuando se trabaja con texto en ocasiones puede ser necesario hacer modificaciones en lo que corresponde a la presencia de may√∫sculas y min√∫sculas. Podr√≠amos por ejemplo tener de *entrada* un texto completamente en may√∫sculas y convertirlo en min√∫sculas, o el caso contrario. En Python las cadenas de caracteres disponen de los m√©todos `upper` y `lower` que nos permiten convertir en may√∫sculas y min√∫sculas, de manera respectiva, todas las letras que conforman una cadena de texto.

Vamos a definir una variable `frase` en la cual *guardaremos* la siguiente cadena:

In [42]:
frase = "Hola mundo"

Si quisi√©ramos convertir toda la cadena en may√∫sculas utilizamos el m√©todo `upper`:

In [45]:
frase.upper()

'HOLA MUNDO'

Si por el contrario quisi√©ramos que todas las letras fueran min√∫sculas utilizamos el m√©todo `lower`:

In [46]:
frase.lower()

'hola mundo'

Debes tener cuidado y considerar que al momento de utilizar los m√©todos `upper` y `lower`, estos no modifican a la cadena de caracteres almacenada en `frase`, sino que devuelven una nueva cadena con las modificaciones realizadas. Esto se debe a que las cadenas en Python son objetos *inmutables* y una vez creadas no pueden modificarse. Observa que si en este punto imprimimos la variable `frase` tendr√≠amos exactamente la misma cadena (sin modificar) definida inicialmente:

In [52]:
print(frase)

Hola mundo


Si quisieras modificar la cadena almacenada en la variable `frase`, entonces tendr√≠as que hacer una reasignaci√≥n, como se muestra en el siguiente ejemplo:

In [58]:
frase = frase.upper()
print(frase)

HOLA MUNDO


Podemos observar que ahora la variable `frase` almacena la versi√≥n en may√∫sculas de la cadena.

Otro m√©todo que puede resultarte de utilidad es `capitalize`, el cual te permite colocar la primera letra en may√∫sculas y todas las dem√°s en min√∫sculas, como habitualmente ocurre con una oraci√≥n. Observa el ejemplo siguiente:

In [60]:
texto = "mi perro es color bermejo"
texto.capitalize()

'Mi perro es color bermejo'

## Formateo de cadenas de caracteres

En el contexto de este cap√≠tulo entenderemos el formateo de una cadena de caracteres como las operaciones o instrucciones que permiten obtener una cadena final a partir de la uni√≥n o sustituci√≥n de un conjunto de datos. 

Previamente hemos aprendido que podemos concatenar cadenas, as√≠ por ejemplo si tuvi√©ramos un programa que pide el nombre y  apellidos del usuario, podr√≠amos unir esa informaci√≥n mediante concatenaci√≥n y generar, por ejemplo, un saludo personalizado, observemos:

In [12]:
nombre = input("Ingresa tu nombre: ")
apellidos = input("Ingresa tus apellidos: ")
saludo = "Hola " + nombre + " " + apellidos + ", bienvenid@."
print(saludo)

Ingresa tu nombre: Jorge
Ingresa tus apellidos: De Los Santos
Hola Jorge De Los Santos, bienvenid@.


Una manera m√°s conveniente de lograr lo anterior es haciendo formateo de cadenas, a diferencia de la concatenaci√≥n suele ser una forma m√°s limpia y mantenible de generar cadenas en donde hay valores que van a cambiarse de forma din√°mica dependiendo los datos que se generen durante la ejecuci√≥n del c√≥digo.

Por ejemplo lo anterior podr√≠a hacerse utilizando el m√©todo `format` de las cadenas de caracteres, de la siguiente manera:

In [13]:
nombre = input("Ingresa tu nombre: ")
apellidos = input("Ingresa tus apellidos: ")
saludo = "Hola {0} {1}, bienvenid@.".format(nombre, apellidos)
print(saludo)

Ingresa tu nombre: Jorge
Ingresa tus apellidos: De Los Santos
Hola Jorge De Los Santos, bienvenid@.


Los t√©rminos `{0}` y `{1}` son los marcadores de posici√≥n (*placeholders*) que indican que esa posici√≥n ser√° ocupada por los argumentos pasados al m√©todo `format`, que en este caso son los valores almacenados en `nombre` y `apellidos`.

Otra manera de realizar lo anterior es utilizando los *f-strings*, observemos el siguiente c√≥digo:

In [14]:
nombre = input("Ingresa tu nombre: ")
apellidos = input("Ingresa tus apellidos: ")
saludo = f"Hola {nombre} {apellidos}, bienvenid@."
print(saludo)

Ingresa tu nombre: Jorge
Ingresa tus apellidos: De Los Santos
Hola Jorge De Los Santos, bienvenid@.


Los *f-strings* son la manera m√°s conveniente de formatear strings en Python, est√°n disponibles desde la versi√≥n 3.6. Puedes observar que √∫nicamente anteponemos una `f` a la definici√≥n de la cadena, esto nos permite utilizar marcadores de posici√≥n que hacen uso directamente del nombre de variables dentro del string, lo cual hace que se gane mucho en concisi√≥n y claridad. En lo subsiguiente vamos a describir las dos formas anteriores de formatear strings.

### El m√©todo `format`

El m√©todo `format` permite dar formato a cadenas de caracteres, mediante la sintaxis:

```
string.format(arg1, arg2, ...)
```

Donde `string` es una cadena de caracteres que contiene marcadores de posici√≥n que ser√°n sustituidos por los valores `arg1`, `arg2`, etc. Los marcadores de posici√≥n se definen utilizando llaves y dentro de ellas se puede colocar un n√∫mero, un nombre o una expresi√≥n que permitir√° formatear el valor pasado como argumento. 

Veamos el siguiente ejemplo:

In [19]:
texto = "{} + {}"
print( texto.format(1,2) )

1 + 2


Observa que los dos pares de llaves se reemplazan por los valores num√©ricos pasados como argumentos, en ese mismo orden. Si quisi√©ramos *controlar* expl√≠citamente el orden de aparici√≥n dentro de la cadena podr√≠amos utilizar marcadores de posici√≥n con un consecutivo (√≠ndice), por ejemplo:

In [27]:
texto = "{1} + {0}"
print( texto.format(1,2) )

2 + 1


Lo anterior indica que `{0}` se sustituir√° por el primer argumento pasado al m√©todo `format`, `{1}` por el segundo argumento y as√≠ de manera consecutiva en el caso de que hubiera m√°s argumentos.

Es posible tambi√©n utilizar argumentos nombrados para el m√©todo `format` e indicarlos con dicho en el marcador de posici√≥n, observa lo siguiente:

In [28]:
texto = "{apellidos}, {nombre}"
print( texto.format(nombre="Juan", apellidos="P√©rez L√≥pez") )

P√©rez L√≥pez, Juan


En algunas situaciones cuando trabajamos con n√∫meros es muy probable que necesitemos mostrar los resultados con cierta cantidad de decimales o cifras significativas y/o en una notaci√≥n espec√≠fica, con `format` tenemos algunas posibilidades. Por ejemplo, vamos a mostrar el valor de $pi$ con algunos decimales:

In [30]:
texto = "{pi}"
print(texto.format(pi=3.14159265359))

3.14159265359


Si quisi√©remos mostrar √∫nicamente cuatro decimales podr√≠amos hacerlo de la siguiente manera:

In [31]:
texto = "{pi:.4f}"
print(texto.format(pi=3.14159265359))

3.1416


Observa que colocamos dos puntos y enseguida un *especificador de formato* `.4f`, este especificador le indica al m√©todo `format` que √∫nicamente queremos mostrar cuatro decimales. Si quisi√©ramos mostrar seis decimales utilzar√≠amos `.6f`, y as√≠ con cualquier otra cantidad. En lo anterior `f` es el indicativo de un formateo de punto fijo.

Podemos tambi√©n mostrar un n√∫mero utilizando notaci√≥n cient√≠fica, para ello utilizamos el especificador de formato `E` o `e`. En las calculadores se suele utilizar el caracter `E` (o alguno similar) para indicar 10 elevado a una potencia, por ejemplo `3.5E5` ser√≠a el equivalente de $3.5 \times 10^5$. Veamos como funciona:

In [42]:
fuerza = 7500
area = 0.08 * 0.03 
esfuerzo = fuerza / area
texto = "El esfuerzo normal es de {0:E} Pa"
print( texto.format(esfuerzo) )

El esfuerzo normal es de 3.125000E+06 Pa


Podemos controlar tambi√©n el n√∫mero de decimales a mostrar:

In [51]:
fuerza = 7500
area = 0.08 * 0.03 
esfuerzo = fuerza / area
texto = "El esfuerzo normal es de {0:.2E} Pa"
print( texto.format(esfuerzo) )

El esfuerzo normal es de 3.13E+06 Pa


In [22]:
print( "{0:.2%}".format(0.75) )

75.00%


### Los *f-strings*

A partir de la versi√≥n 3.6 de Python podemos hacer uso de los *f-strings* para formatear cadenas de caracteres de una forma mucho m√°s conveniente. Con los *f-strings* podemos sustituir directamente en la cadena el valor de una variable o el resultado de un conjunto de operaciones, observa lo siguiente:

In [1]:
a = 10
b = 20
print(f"{a} + {b} = {a + b}")

10 + 20 = 30


Primero, debemos notar que para que Python pueda interpretar que estamos creando un *f-string* debemos anteponerle una `f` a la definici√≥n de la cadena de caracteres. Observa que los nombres de las variables encerrados entre llaves `{a}` y `{b}` se sustituyen por el valor *guardado* en cada variable, la expresi√≥n `{a + b}` nos permite evaluar una operaci√≥n de suma aritm√©tica entre los dos valores num√©ricos almacenados en `a` y `b` y sustituir el resultado en la cadena.

Las especificaciones de formato descritas para el m√©todo `format` siguen siendo v√°lidas en los `f-strings`.

In [14]:
fuerza = 7500
area = 0.08 * 0.03 
esfuerzo = fuerza / area
texto = f"El esfuerzo normal es de {esfuerzo:.2E} Pa"
print( texto )

El esfuerzo normal es de 3.13E+06 Pa


Naturalmente, es mucho m√°s sencillo (tanto para la escritura, lectura como para el mantenimiento del c√≥digo) sustituir directamente el nombre de una variable dentro de la cadena de caracteres.

Como ya se mencionaba, en los *f-strings* podemos sustituir el resultado de una operaci√≥n o de una instrucci√≥n. Observa el siguiente ejemplo en el cual se muestra la equivalencia en el sistema binario de un entero expresado en el sistema decimal:

In [27]:
n = int( input("Inserta un entero: ") )
print( f"El n√∫mero {n} en binario es {bin(n)}" )

Inserta un entero: 12
El n√∫mero 12 en binario es 0b1100


Podemos observar que dentro del *f-string* se hace una invocaci√≥n a la funci√≥n `bin`, la cual es una funci√≥n nativa de Python que recibe un entero y devuelve su representaci√≥n en el sistema binario. Lo anterior tambi√©n podr√≠amos lograrlo sin necesidad de hacer uso de la funci√≥n `bin`, sino en su lugar modificar los especificadores de formato, tal como se muestra enseguida:

In [28]:
n = int( input("Inserta un entero: ") )
print( f"El n√∫mero {n} en binario es {n:b}" )

Inserta un entero: 12
El n√∫mero 12 en binario es 1100


El modificador de formato `:b` indica que el valor pasado en el *placeholder* se debe mostrar en formato binario.

## Buscando en una cadena de caracteres

En este apartado vamos a revisar c√≥mo buscar una cierta secuencia de caracteres dentro de una cadena. Buscar coincidencias en un texto suele ser una tarea muy com√∫n para algunos sistemas automatizados. En Python, las cadenas de caracteres poseen m√©todos que permiten *buscar* en ellas coincidencias. 

Vamos a crear una variable `frase`, en la cual *almacenaremos* una cadena de caracteres:

In [43]:
frase = "La estrella m√°s cercana es Pr√≥xima Centauri"

Si quisi√©ramos saber cu√°ntas veces aparece en esa frase una cierta letra, entonces podr√≠amos utilizar el m√©todo `count`. Este m√©todo simplemente recibe como argumento la secuencia de caracteres que queremos buscar y nos devuelve la cantidad de veces que dicha secuencia de caracteres aparece, tal como se muestra enseguida:

In [49]:
frase.count("a")

6

Observa que en la l√≠nea anterior estamos buscando cu√°ntas veces aparece la letra `a` dentro de `frase`. Si contamos *manualmente*, podr√°s observar que el m√©todo `count` est√° ignorando la letra `√°` con tilde. Naturalmente, Python no puede saber, al menos en principio, que `√°` es tambi√©n una letra `a`, pero con la particularidad escrita de la tilde. Una manera bastante simplista de considerar en la contabilizaci√≥n a la letra `√°` tildada ser√≠a como sigue:

In [51]:
frase.count("a") + frase.count("√°")

7

Con el m√©todo `count` no solamente podemos contabilizar el n√∫mero de veces que aparece un caracter, sino tambi√©n cualquier secuencia de caracteres. Observa el siguiente ejemplo:

In [56]:
texto = """Los amorosos callan.
El amor es el silencio m√°s fino,
el m√°s tembloroso, el m√°s insoportable.
Los amorosos buscan,
los amorosos son los que abandonan,
son los que cambian, los que olvidan.
"""

In [57]:
texto.count("silencio")

1

Con la l√≠nea anterior buscamos la cadena `silencio` dentro del texto creado. Hay que ser un poco precavidos cuando utilizamos el m√©todo `count`, veamos el siguiente caso:

In [62]:
texto.count("amor")

4

De acuerdo con lo anterior la secuencia de caracteres `amor` aparece cuatro veces. Si observas el texto ver√°s que la palabra amor aparece una sola vez, sin embargo la subcadena `amor` forma parte tambi√©n de la palabra `amorosos`, la cual aparece tres veces. Si quisi√©ramos √∫nicamente contabilizar la palabra `amor`, como tal, tendr√≠amos que a√±adir los espacios en blancos al inicio y final de la palabra, es decir, algo como lo siguiente:

In [63]:
texto.count(" amor ")

1

En el caso de que √∫nicamente nos interese saber si una subcadena forma parte de un texto, podemos utilizar el operador `in`. De manera general, el operador `in` nos permite verificar si un determinado elemento est√° presente en una secuencia. Observa el siguiente ejemplo:

In [77]:
texto = """
La ley de la gravedad de Newton nos dice tambi√©n que cuanto m√°s separados est√©n
los cuerpos menor ser√° la fuerza gravitatoria entre ellos.
"""

In [78]:
"Newton" in texto

True

In [79]:
"Dirac" in texto

False

Podemos verificar que si la palabra (o secuencia de caracteres) que *buscamos* est√° contenida en la variable `texto`, entonces se devuelve un valor l√≥gico `True`, de lo contrario devolver√° un `False`, tal como se puede constatar al momento que buscamos la cadena `Dirac` dentro de `texto`.

---
**Ejemplo. Contando vocales en una palabra**

En este ejemplo vamos a desarrollar un programa que dada una palabra nos devuelva la cantidad vocales totales que hay en esta.

In [1]:
palabra = "Perro"

ka = palabra.count("a") # cantidad de letras a
ke = palabra.count("e") # cantidad de letras e
ki = palabra.count("i") # cantidad de letras i
ko = palabra.count("o") # cantidad de letras o
ku = palabra.count("u") # cantidad de letras u

numero_de_vocales = ka + ke + ki + ko + ku

print(f"En la palabra '{palabra}' hay {numero_de_vocales} vocales")

En la palabra 'Perro' hay 2 vocales


## Una breve introducci√≥n a las expresiones regulares

Las expresiones regulares son patrones que se utilizan para hacer coincidir combinaciones de caracteres en cadenas [^regex]. Son una herramienta poderosa para buscar, analizar y modificar texto. En general, las expresiones regulares permiten:

* **B√∫squeda**: encontrar coincidencias de un patr√≥n en un texto.
* **Extracci√≥n**: obtener partes espec√≠ficas de un texto que coincidan con un patr√≥n.
* **Reemplazo**: cambiar partes de un texto por otras seg√∫n un patr√≥n.
* **Validaci√≥n**: verificar si un texto cumple con un formato espec√≠fico.

[^regex]: https://www.calculo.jcbmat.com/id454.htm

Las expresiones regulares se componen de una serie de caracteres especiales que tienen un significado espec√≠fico. Estos caracteres se pueden combinar para crear patrones complejos. Algunos de los caracteres m√°s comunes son:

* `.` (punto): coincide con cualquier car√°cter.
* `[]`: (corchetes): coincide con cualquier car√°cter dentro del rango especificado.
* `{}`: (llaves): indica la cantidad de veces que debe repetirse el caracter anterior.
* `?` (signo de interrogaci√≥n): indica que el caracter anterior es opcional.
* `*`: (asterisco): indica que el caracter anterior puede repetirse 0 o m√°s veces.
* `+`: (signo m√°s): indica que el caracter anterior puede repetirse 1 o m√°s veces.

In [18]:
import re

In [43]:
texto = "Hoy es 12/11/2021 o bien 07/03/21 o 12-dic-2020"

In [46]:
re.findall("(\d{2}/\d{2}/\d{2,4}|\d{2}-\w{3}-\d{2,4})", texto)

['12/11/2021', '07/03/21', '12-dic-2020']

In [48]:
re.finditer("(\d{2}/\d{2}/\d{2,4}|\d{2}-\w{3}-\d{2,4})", texto)

<callable_iterator at 0x2d8dc81ecd0>

## Ejercicios

---
Escriba un programa que determine si una palabra es un pal√≠ndromo. Deber√° mostrar `Es pal√≠ndromo` en el caso de que lo sea y `No es pal√≠ndromo` en el otro caso.

---
Desarolle un programa que dada una frase, reemplace todas las vocales que contiene por cada una de las vocales. Como en esa canci√≥n infantil de [*El sapo no se lava el pie*](https://www.youtube.com/watch?v=BqXWH19G6NQ). As√≠ por ejemplo, si la frase es `el sapo no se lava el pie`, entonces el programa deber√° mostrar:

```
al sapa na sa lava al paa
el sepe ne se leve el pee
il sipi ni si livi il pii
ol sopo no so lovo ol poo
ul supu nu su luvu ul puu
```